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摘要 : GATA 因子 在 植物 中 广泛 参与 了 光 响 应 调控 、 叶 绿 素 合成 以 及 碳 、 氮 代谢 等 与 作物 产量 息息相关 的 
生物 学 过 程 。 本 研究 基于 曹 麻 基因 组 信息 ， 鉴 定 了 19 (EUR GATA 家 族 成 员 ， 根 据 基因 结构 、 和 蛋白 结构 
和 系统 进化 分 析 将 其 分 为 4 个 亚 家 族 。 理 化 性 质 分 析 发 现 GATA 蛋白 具有 亲 水 性 。 基 因 和 和 蛋白 结构 分 析 发 
Sh, BERR SWAT iY GATA 成 员 在 结构 上 非常 保守 。 利 用 高 通 量 RNA-seq 测序 数据 分 析 曹 麻 GATA 基因 在 
各 个 组 织 中 的 表达 情况 ， 发 现 GATA 基因 主要 在 根 和 叶 中 表达 ， 在 种 子 中 表达 较 低 。 进 一 步 通 过 半 定 量 
RT-PCR 技术 检测 GATA 基因 在 黑暗 下 的 表达 情况 ,结果 显示 有 三 个 GATA 基因 在 黑暗 处 理 后 表达 下 调 ， 预 
IA EEK GATA 基因 参与 了 光 响 应 调控 过 程 。 这 些 信息 为 苑 麻 GATA 基因 家 族 的 功能 分 析 和 提高 草 麻 产量 
提供 了 理论 基础 。 
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Identification and Characterization of GATA Gene Family 
in Castor Bean ( Ricinus communis ) 


AO Tao'?, LIAO Xiao-jia^?, XU Wei^?, LIU Ai-zhong'™ 
(1 Key Laboratory of Tropical Plant Resource and Sustainable Use, Xishuangbanna Tropical Botanical Garden, Chinese Academy of Science , 
Mengla, Yunnan 666303, China; 2 Kunming Institute of Botany, Chinese Academy of Science, Kunming 650201 China; 
3 Graduate University of Chinese Academy of Science, Beijing 100049, China) 


Abstract; GATA proteins are considered to be broadly involved in yield-associated biological process, such as pho- 
toresponse , chlorophyll biosynthesis, and carbon and nitrogen metabolism. Based on castor bean genome database, a 
total of 19 GATA genes were identified and classified into 4 subfamilies according to gene structure, protein structure 
and their phylogenetic relationships. Results exhibited that GATA factors were hydrophilic proteins. Analysis of gene 
structure and protein structure revealed the conserved structural features of GATA factors between castor bean and 
Arabidopsis thaliana. The high-throughput RNA-seq data were used to define the expressional profiles of GATA genes 
among tissues. The results showed that most of the castor GATA genes preferentially expressed in leaf and root in con- 
trast to their expression in developing seeds. In particular, the expression of GATA genes responding to darkness 
treatment in leaves was detected using semi-quantitative RT-PCR. It was shown that expression of three genes was 
down-regulated under darkness treatment, which suggests a role for GATA genes of castor bean in light-mediated reg- 
ulation. These results provide important theoretical basis to the functions identification of castor GATA genes and in- 
crease castor yields. 
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GATA 因子 是 一 类 广泛 存在 于 真 核 生 物 中 的 
转录 因子 ， 在 植物 光 响 应 调控 、 叶 绿 素 合 成 、 细 
胞 分 裂 素 响应 以 及 碳 、 氮 代谢 等 生物 学 过 程 中 发 
挥 重要 作用 ， 这 些 生物 学 过 程 与 作物 产量 息 息 相 
X, 对 GATA 家 族 的 研究 可 以 为 作物 增产 提供 一 
定 的 理论 基础 。GATA 因子 因 特 异 结合 WGATAR 
基因 序列 (WHT BK A; R 为 CG 或 A; Lowry 和 
Atchley, 2000) 而 得 名 ， 其 DNA 结合 域 由 一 个 IV 
类 锌 指 结构 (C-X,-C-X,,,-C-X,-C) 和 其 后 的 基本 
区 域 组 成 (Lowry 和 Atchley，2000) 。 在 动物 中 ， 
GATA 因子 含有 两 个 典型 的 C-X,-C-X,,-C-X,-C 锌 
指 结构 域 ， 其 中 只 有 C 端的 锌 指 结构 与 DNA 结合 
AK; 动物 的 GATA 转录 因子 在 发 育 、 分 化 和 细 
胞 增殖 过 程 中 发 挥 重 要 作用 (Patient 和 McGhee， 
2002) 。 大 部 分 酵母 的 GATA 蛋白 只 含有 一 个 单独 
的 C-X,-C-X,,-C-X,-C 或 C-X,-C-X,,-C-X,-C 结构 
域 (Teakle 和 Gilmartin, 1998) ; 酵母 的 GATA 转 
RAFT ZEST SRE WATE, WAH, 
FETE ASEM. RCT EZ RE ( Scazzoc- 
chio, 2000) 。 通 过 核磁 共振 的 方法 ， 解 析 了 两 个 
GATA 结合 域 的 结构 : 鸡 GATAL 蛋白 的 C 端 锌 指 
结构 (Omichinski 等 ，1993 ) 和 构 梨 曲霉 AreA 蛋 
白 的 锌 指 结构 (Staric 等 , 1998) 。 结 果 显 示 ，GA- 
TA 结合 域 由 两 对 反 向 平行 的 B DER. — o 螺 
旋 和 一 个 非 结构 化 的 尾巴 组 成 。 

在 植物 中 ， 第 一 个 GATA 转录 因子 是 从 烟草 
中 鉴定 到 的 ， 被 命名 为 NTL1， 是 粗糙 脉 胞 戎 
GATA 成 员 NIT2 的 同 源 物 ( Daniel-Vedele fil 
Caboche, 1993)。 之 后 ，Reyes 等 (2004) 从 拟 南 
芥 和 水 稻 基 因 组 中 分 别 鉴定 到 了 29 个 和 28 个 
GATA 转录 因子 ， 并 发 现 大 部 分 GATA EARE 
有 一 个 C-X,-C-X,-C-X,-C 锌 指 结构 域 ,， 同时 也 
有 少数 蛋白 含有 两 个 锌 指 结 构 域 或 C-X,-C-X,。- 
C-X,-C 结构 。 根 据 系统 进化 关系 、 结 构 域 组 成 
和 内 含 子 -外 显 子 构成 ， 将 拟 南 芥 GATA 家 族 成 
员 分 成 了 四 个 亚 家 族 ， 并 将 水 稻 GATA 家 族 成 员 
分 成 了 六 个 亚 家 族 。 在 拟 南 芥 中 ， 亚 家 族 工 含有 
两 个 外 显 子 ， 编 码 GATA 结构 域 的 基因 序列 位 于 
第 二 个 外 显 子 上 ; 亚 家 族 工 的 基因 由 两 到 三 个 
外 显 子 组 成 ， 编 码 GATA 结构 域 的 DNA 序列 被 
内 含 子 隔 开 ， 位 于 后 两 个 外 显 子 上 ; 亚 家 族 M 
的 基因 由 七 个 外 显 子 构成 ， 编 码 锌 指 结构 域 的 基 





































































































因 序 列 位 于 第 五 个 外 显 子 ; 亚 家 族 IV 没有 保守 
的 基因 结构 ， 其 锌 指 结构 域 位 于 氨基 端 (Reyes 
等 , 2004) 。 除 GATA 结构 域 之 外 ， 亚 家 族 工 的 
成 员 还 含有 一 个 氨基 端的 酸性 结构 域 , 亚 家 族 II[ 
的 蛋白 还 含有 一 个 CCT 结构 域 , 水 稻 的 亚 家 族 
V 还 含有 一 个 ZnF PMZ 结构 域 (Plant mutator 
transposase zinc finger domain) 和 一 个 FARI1 结构 
域 (Reyes 等 ,2004) ， 这 些 结构 域 可 能 赋予 了 
GATA 家 族 成 员 更 多 的 生物 学 功能 。 例 如 ，CCT 
结构 域 最 先是 在 开花 时 间 控 制 蛋白 CONSTANS 
(CO) 中 鉴定 到 的 ， 被 认为 与 蛋白 和 和 蛋白 的 结合 
有 关 (Robson 等 , 2001; Griffiths 等 , 2003); ZnF 
PMZ 结构 域 和 FAR1 结构 域 都 在 MULE 转 座 子 家 
族 的 转 座 酶 中 和 光敏 色素 A 信号 转 导 蛋白 (FARI 
和 FHY3) 中 被 发 现 (Lisch 等 , 2001; Hudson 等 ， 
2003), ， 暗 示 着 亚 家 族 V 成 员 在 转 座 过 程 和 光敏 
色素 A 信号 转 导 中 的 潜在 功能 。 

GATA 元 件 存在 于 很 多 光 调 节 基 因 和 昼夜 市 
律 响应 基因 的 调控 区 域 , 通过 凝 胶 迁移 实验 和 
DNase I 足迹 实验 发 现 GATA 因子 可 以 结合 到 这 些 
GATA 元 件 上 ， 预 示 着 GATA 转录 因子 可 能 参与 了 
光 和 昼夜 节律 相关 的 调控 (Jeong 和 Shih, 2003; 
Teakle 等 ，2002; Schindler 和 Cash more, 1990; 
Borello 4, 1993; Terzaghi 和 Cashmore, 1995) , 
之 后 ， 在 拟 南 芥 的 研究 中 发 现 ， 很 多 GATA 转录 
因子 基因 的 表达 可 以 响应 光 培 养 、 暗 培养 以 及 昼 
夜 节律 的 变化 (Manfield 等 , 2007)。Luo ^& (2010) 
发 现 ，GATA2 可 以 直接 调节 许多 光 响 应 基因 和 
油菜 素 类 固 醇 响应 基因 的 表达 ， 并 且 在 光 形 态 发 
生 中 发 挥 重要 作用 。 此 外 ， 大 量 报道 显示 ，GA- 
TA 转录 因子 还 参与 了 叶绿素 水 平 、 叶 绿 体 大 小 和 
光合 效率 的 调节 (Bi 等 , 2005; Chiang 等 , 2012; 
Hudson 等 , 2011, 2013; An 等 , 2014) 。 这 些 研 
究 表明 GATA 转录 因子 在 光 相 关 的 调控 中 发 挥 重 
要 作用 。 除 此 之 外 ，GATA 转录 因子 还 参与 了 种 
子 萌发 (Liu 等 , 2005) ， 细 胞 分 裂 素 应 激 (Kiba 
等 , 2005; Naito 等 , 2007) , 4E fj (Marah fil I- 
rish, 2008) , 48€ (Hudson 等 , 2013) 以 及 碳 、 毛 
代谢 (Hudson 等 , 2013; Wang 等 , 2003; Scheible 
等 , 2004; Bi 等 , 2005; Hudson 等 , 2011) 等 生 

目前 ， 关 于 GATA 家 族 的 研究 主要 局 限 在 拟 
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南 芥 和 水 稻 等 少数 模式 植物 中 ， 其 它 作 物 中 GA- 
TA 转录 因子 的 研究 较 少 。 曹 麻 是 世界 十 大 油料 
作物 之 一 ， 萝 麻油 是 非常 良好 的 生物 柴油 原料 ， 
广泛 应 用 于 工业 生产 的 各 个 领域 ， 然 而 草 麻 产量 
较 低 的 现状 严重 制约 了 生物 柴油 产业 的 发 展 ( 朱 
tees AR, 2007; HOES, 2006; B AE, 
1994) ， 因 此 提高 草 麻 产量 方面 的 研究 具有 重要 
的 现实 意义 。 目 前 关于 提高 草 麻 产量 的 分 子 机 制 
研究 较 少 ， 对 GATA 家 族 的 分 析 和 研究 尚未 见报 
道 。 本 研究 基于 莉 麻 的 基因 组 信息 ， 在 葛 麻 的 基 
因 组 中 鉴定 了 19 个 GATA 家 族 成 员 ， 并 对 其 系 
统 进化 、 理 化 性 质 、 基 因 结 构 、 结 构 域 组 成 和 时 
空 表达 进行 了 分 析 。 此 外 ， 我 们 还 分 析 了 葛 麻 
GATA 基因 在 正常 生长 条 件 下 和 黑暗 条 件 下 的 表 
达 情 况 。 本 研究 结果 对 深入 研究 GATA 基因 家 族 
的 生物 学 功能 和 探索 草 麻 光 相 关 调 控 的 分 子 机 制 
提供 了 一 定 的 研究 基础 ， 并 为 提高 曹 麻 产量 提供 
了 非常 重要 的 理论 依据 和 指导 意义 。 

































































1 材料 和 方法 
1.1 ËR GATA 因子 的 鉴定 ， 分 类 和 基因 结构 分 析 

以 已 报道 的 模式 植物 拟 南 芥 GATA. 蛋白 序列 (ht- 
tp ://www.arabidopsis.org/) 为 基 序 ， 在 曹 麻 基因 组 数据 
FE (http ;//castorbean. jevi.org/index.php) 中 进行 BLASTP 
比 对 ， 设 定 阔 值 为 p<e-10， 序 列 一 致 度 大 于 60%。 对 于 
得 到 的 候选 蛋白 ， 用 Pfam 数据 库 (http://pfam. sanger. 
ac.uk/) 和 SMART 程序 ( http://smart. embl-heidelberg. 
de/) 检测 是 否 具有 典型 的 GATA 结构 域 。 利 用 GSDS 
(Gene Structure Display Server, http://gsds. cbi. pku. edu. 
cn/) TEZX EF AD AT BER GATA. 家 族 各 成 员 的 基因 结构 。 
根据 系统 进化 关系 、 结 构 域 组 成 和 内 含 子 - 外 显 子 构成 ， 
将 GATA 家 族 成 员 分 成 了 四 个 亚 家 族 。 


























12 GATA 蛋白 家 族 的 系统 进化 树 和 蛋白 理化 性 质 分 析 

HT I fife BER AAD BF GATA 蛋白 之 间 的 亲缘 关 
A, FFA Clustal W 软件 对 草 麻 和 拟 南 芥 的 GATA 和 蛋白 序 
列 进行 了 比 对 ， 利 用 MEGAS.0 软件 中 的 邻接 算法 
( Neighbor-Joining ) 构建 系统 进化 树 , Bootstrap 值 设 为 
1000 重复 。 用 ExPaSy 提供 的 在 线 Protparam 软件 ( ht- 
tp://web.expasy.org/protparam/) 进行 氨基 酸 数目 、 不 稳 
定 系 数 、 理 论 等 电 点 、 脂 肪 族 氨基 酸 指数 和 蛋白质 玻 水 
性 的 分 析 。 
1.3 Bik GATA 基因 的 表达 分 析 

实验 曹 麻 品 种 为 淄博 306 (由 淄博 农业 科学 研究 院 
HEIR) o TRA BIR CATA 基因 与 光 相 关 调 控 之 间 的 关 
系 ， 挑 选 在 自然 条 件 下 生长 了 两 个 月 的 获 麻 ,将 其 顶端 
第 三 片 叶片 用 锡 箱 纸 包 庄 72 h 后 ， 取 叶片 进行 后 续 实 
验 ， 对 照 组 正常 生长 ， 至 少 重复 3 次 实验 。 用 Transgene 
公司 的 TRIzol plant RNA 抽 提 试剂 盒 提 取 叶 片 总 RNA, 
利用 Nanodrop 测定 RNA 浓度 和 质量 并 用 琼脂 糖 凝 胶 电 
泳 检测 RNA 质量 。 随 后 取 3 pg 总 RNA 用 Takara 公司 的 
Primescript II Ist strand cDNA Synthesis Kit 试剂 盒 进行 
反 转 录 。RT-PCR 引物 序列 见 表 1。 用 合成 的 cDNA 为 模 
板 进行 PCR 扩 增 ， 程 序 为 94 "C 预 变 性 4 min，94 % 变性 
30s, 55 CEK 30 s, 72 C 延伸 35 s, 25 个 循环 ，72 C 
延伸 7 min, Sb, IH EAT B RATE BE (Xu 
等 , 2013) ， 调 查 了 GATA 基因 在 不 同 组 织 包 括 叶 、 根 、 
授粉 后 20 天 的 种 子 (种 子 1) 、 授 粉 后 35 天 种 子 〈 种 子 
2) 和 授粉 后 40 天 的 胚乳 中 的 表达 情况 。 












































































































































2 结果 与 分 析 

2.1 BER GATA 蛋白 的 鉴定 及 理化 性 质 分 析 
通过 BLASTP 比 对 以 及 Pfam 和 SMART 结构 

分 析 ， 本 研究 获得 了 19 4S EER GATA. 同 源 蛋 白 

(X 2), OTHER CATA 蛋白 进行 理化 性 质 分 析 发 

现 ，19 个 成 员 包 含 122 到 542 个 氨基 酸 数目 不 等 ， 





R1 RT-PCR 引物 序列 
Table 1 Primer for RT-PCR 








基因 名 称 正 向 引物 序列 反 向 引物 序列 扩 增 长 度 
Gene name Forward primer sequences Reverse primer sequences PCR product length/bp 
30131. m007120 TTTCTCACCAGCGAACTTGC CCGCTGGTTTTCTCTTTGCT 430 
29904. m003012 GCGGAGGAAGAGCTTGAATG AACGTGGGACTACTAGCAGG 485 
29794. m003323 GCCAGTGAAATTTACAGTCAAGT TGCTGCTTCTTCAACATCCTC 454 
29912. m005322 CCCACCTCAAGAAGAAGTTGG GTCTTCATGGCTGCTGTGTC 564 
29838. m001723 CTGTTGGGTCTGACAAGTGC GGTTCAGATTGAGGAGTCGTATTG 391 
29838. m001724 TGGAGGTGGTGAGGAGTCTA CTTGTCCAGAACCCTGTGGTC 530 
29596. m000720 CTGGTCCACATGGTCTAGAAGTTG TGCACATTCTTCCACACCAG 440 
27940. m000323 AGGGGTTGTCCATGACTACAATC TGAATAAGCCTCATTTGTTGAGC 453 
Actin GAGCTTCGTGTTGCTCCTGAG TGGCCATCAGGAAGCTCATAG 461 
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X2 EM GATA 蛋白 的 理化 性 质 分 析 
Table 2 Physical and chemical properties of castor bean GATA proteins 
亚 家 族 基因 座位 编码 氨基酸 不 稳定 系数 脂肪 族 氨基 酸 指数 ”等 电 点 ER Ait HE 
Subfamily Gene loci Coded amino acids Instability index Aliphatic index pl Hydrophobicity 
29634. m002055 398 67.90 60. 48 6. 03 -0. 58 
30131. m007120 368 61.01 51.14 5.00 -0. 73 
REED 30146. m003524 338 52.36 51. 75 6.22 -0. 70 
MEA I 
: 30174. m008809 235 58.57 66.47 7.00 -0.62 
Subfamily I 
29904. m003012 205 61.45 58. 39 10. 06 -0.81 
277538. m000326 323 73.32 54. 06 7.04 -0. 80 
27494. m000044 359 65. 55 62.17 6.60 -0. 58 
29634. m002146 332 54. 39 52.62 5. 66 -0. 70 
28035. m000366 161 49. 38 48.51 9.57 -1.02 
dasi 0128. m008883 151 7. 83 54.97 10. 27 -0. 83 
亚 家 族 工 30128. m00888 67.8 9 
. 30076. m004701 122 40. 33 60. 82 9. 53 -0.67 
Subfamily IT 
29794. m003323 186 41. 02 53. 60 9. 68 -0. 70 
29912. m005322 312 54.52 58.21 9.16 —0. 89 
29889. m003248 149 55.24 61. 61 9. 79 —0. 98 
29596. m000719 327 44. 86 70. 64 4. 84 -0.65 
亚 家 族 TIE 29838. m001723 313 36.95 62.27 5.06 -0. 66 
Subfamily III 29838. m001724 311 45. 07 61. 77 5.07 -0. 70 
29596. m000720 324 38. 55 59. 23 7.73 -0.71 
EARN 27940. m000323 542 53. 97 73.36 6. 53 -0.62 


Subfamily IV 


与 已 报道 的 物种 拟 南 芥 和 水 稻 一 致 (Reyes 等 ， 
2004) ， 各 成 员 之 间 的 氨基 酸 数目 保守 性 很 低 。 对 
和 蛋白 杂 / 中 水 性 进行 预测 ， 发 现 19 个 蛋白 的 GRA- 
VY 值 都 为 负 值 ， 即 草 麻 的 GATA 蛋白 都 是 亲 水 蛋 
白 ， 只 是 亲 水 程度 有 所 差异 。 除 29838. m001723 
和 29596. m000720 属于 稳定 蛋白 之 外 ， 其 余 17 
个 成 员 均 为 不 稳定 蛋白 。 草 麻 GATA 和 蛋白 理化 性 
质 的 分 析 可 以 为 进一步 的 蛋白 提纯 、 活 性 和 功能 
研究 提供 理论 基础 。 
2.2 ER GATA 蛋白 的 分 类 和 特征 分 析 

根据 系统 进化 关系 、 结 构 域 组 成 和 内 含 子 - 外 
显 子 构成 ， 将 CATA 家 族 成 员 分 成 了 四 个 亚 家 族 ， 
亚 家 族 工 包含 7 个 成 员 ， 亚 家 族 工 也 包含 7 个 成 
R, WARM 包含 4 个 成 员 ， 亚 家 族 IV 只 包含 1 
AG, BEAR, BURR GATA 和 蛋白 主要 分 
为 四 个 文 ， 且 拓扑 结构 明显 ， 除 29889. m003248 
之 外 ， 各 个 亚 家 族 的 蛋白 都 分 别 聚 在 一 文 (图 
1: A)。 对 各 亚 家 族 进行 结构 域 分 析 发 现 ， 亚 家 
族 工 和 亚 家 族 工 成 员 只 含有 一 个 GATA 结构 域 ， 
而 除 GATA 结构 域 之 外 ， 亚 家 族 VL 的 4 个 成 员 都 
含有 一 个 额外 的 CCT 结构 域 ， 其 中 3 个 成 员 还 含有 





























一 个 TIFY 结构 域 ， 亚 家 族 IV 的 27940. m000323 
还 含有 一 个 额外 的 ASXH 结构 域 (图 1: B), TE 
拟 南 芥 的 报道 中 ， 亚 家 族 工 的 成 员 还 含有 一 个 氮 
基 端 的 酸性 结构 域 ; 亚 家 族 II 只 含有 GATA Zi 
构 域 和 CCT 结构 域 ， 而 缺少 TIFY 结构 域 ; 亚 家 
族 IV 也 缺少 额外 的 ASXH 结构 域 (Reyes 等 ， 
2004) ， 这 些 差异 可 能 来 源 于 检测 方法 和 参数 设 
置 的 不 同 。 本 研究 重新 用 Pfam 和 SMART 检测 
了 拟 南 芥 GATA 和 蛋白 的 结构 域 组 成 ， 在 亚 家 族 I 
中 未 检测 到 酸性 结构 域 存在 ， 且 在 亚 家 族 UI 的 
所 有 成 员 中 都 检测 到 了 CCT 结构 域 和 TIFY 结构 
域 ， 此 外 ， 也 在 亚 家 族 IV 的 所 有 成 员 中 检测 到 
了 ASXH 结构 域 (数据 未 显示 )， 45 EER GATA 
蛋白 的 结构 域 组 成 一 致 。 

对 GATA 家 族 成 员 的 基因 结构 分 析 发 现 ， 亚 
家 族 工 含有 两 个 外 显 子 ， 编 码 GATA 结构 域 的 基 
因 序 列 位 于 第 二 个 外 显 子 上 ; XA I 的 基因 
由 两 到 四 个 外 显 子 组 成 ， 编 码 GATA 结构 域 的 
DNA 序列 被 内 含 子 隔 开 ， 位 于 后 两 个 外 显 子 上 ; 
亚 家 族 TT 的 基因 由 七 到 十 一 个 外 显 子 构成 ， 编 
码 锌 指 结构 域 的 基因 序列 位 于 第 五 个 外 显 子 ; 亚 
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ZU IV 由 八 个 外 显 子 组 成 ， 编 码 GATA 结构 域 











日 结构 、 基 因 结 构 和 进化 关系 上 都 非常 同 源 ， 预 





的 DNA 序列 也 被 内 含 子 隔 开 ， 位 于 前 两 个 外 显 
子 上 (图 1: C) ， 这 些 基 因 结 构 特 征 与 拟 南 芥 非 
常 相 似 (Reyes 等 , 2004) 。 为 了 调查 GATA ÆA 
的 锌 指 结构 域 特征 ， 我 们 对 曹 麻 和 拟 南 芥 GATA 
蛋白 的 锌 指 结 构 域 进行 了 序列 比 对 ， 并 参考 
Reyes 等 (2004) 的 标准 ， 标 示 了 和 锌 指 结构 域 的 
二 级 结构 一 四 个 B 折 受 和 一 个 o 螺旋 (图 2). 
比 对 结果 显示 ， 除 亚 家 族 II 的 锌 指 结构 为 C-X,- 
C-X4-C-X,-C 之 外 ， 其 余 三 个 家 族 的 锌 指 结构 都 
为 C-X,-C-Xis-C-X,-C, 与 拟 南 其 的 报道 一 致 
(Reyes 等 , 2004) 。 此 外 ， 如 图 2 所 示 ， 锌 指 结 
构 域 的 很 多 氨基 酸 位 点 在 所 有 莫 麻 和 拟 南 芥 的 
GATA 成 员 中 是 高 度 保守 的 ， 如 Cys-3, Cys-6, 
Thr-13, Pro-14, Arg-17, Gly-19, Pro-20 以 及 第 
ZAFARI MEFA] (LCNACG ) ， 这 些 
保守 的 氨基 酸 可 能 与 GATA 转录 因子 的 DNA 结 
合 功能 以 及 转录 激活 功能 有 关 。 为 了 进一步 探索 
HERA RAF GATA 和 蛋白 之 间 的 系统 进化 关系 ， 
用 19 EPR GATA. 蛋白 和 29 个 拟 南 芥 GATA Æ 
白 序 列 进行 系统 进化 树 分 析 。 如 图 3 tas, BOR 
和 拟 南 芥 的 GATA 蛋白 被 分 为 四 个 大 支 ， 除 
At5g26930 之 外 ， 各 个 亚 家 族 的 成 员 都 单独 聚 在 
— x, WB] GATA 蛋白 在 曹 及 和 拟 南 芥 中 是 同 源 
的 。 综 上 所 述 ， 草 麻 与 拟 南 芥 的 GATA 成 员 在 蛋 


























ZA EERE GATA 蛋白 与 拟 南 芥 GATA 和 蛋白 在 植 
物 中 发 挥 着 相似 的 功能 。 而 GATA 转录 因子 各 亚 
家 族 基因 结构 和 蛋白 结构 的 差异 预示 着 各 亚 家 族 
间 基 因 功 能 的 分 化 。 
2.3 BRR GATA 基因 的 表达 分 析 

我 们 首先 利用 已 报道 的 草 麻 基因 表达 谱 数 据 
调查 了 GATA 基因 在 根 、 叶 、 种 子 1、 种 子 和 胚 
乳 中 的 表达 情况 。 如 图 4 所 示 ， 除 30146. m003524, 
30076. m004701 和 29889. m003248 之 外 ， 其 余 16 
个 基因 在 测序 的 五 个 组 织 中 都 检测 到 表达 ， 大 部 
分 基因 表现 出 明显 的 组 织 偏爱 性 表达 。 几 乎 所 有 
的 基因 在 种 子 2 和 胚乳 中 表达 量 都 很 低 ， 只 有 2 
个 基因 (29904. m003012 和 27940. m000323) 在 
种 子 1 中 有 较 高 的 表达 ; 在 根 中 ， 有 3 个 基因 
(27940. m000323 , 27538. m000326 和 29904. m003012) 
表达 量 较 高 ;而 在 叶 中 有 8 个 基因 (30131. m007120, 
29904. m003012, 29794. m003323 , 29912. m005322, 
29838. m001723, 29838. m001724, 29596. m000720 
和 20912. m005322) 表达 量 较 高 ， 且 30131. m007120, 
29794. m003323 和 29912. m005322 为 叶片 偏爱 性 
表达 基因 ， 强 烈 预 示 着 CATA 基因 家 族 成 员 ， 特 
别 是 3 个 叶 偏爱 表达 基因 在 叶 中 发 挥 着 重要 功能 。 
大 量 文献 报道 GATA 家 族 转录 因子 参与 了 光 相 关 
的 调节 过 程 ， 而 叶片 是 植物 进行 光合 作用 以 及 光 
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BERE GATA 成 员 的 基因 结构 和 功能 域 组 成 





A. EK GATA 蛋白 的 系统 进化 树 分 析 ; B. RUBE GATA 蛋白 的 功能 域 组 成 ; C. BURR GATA 家 族 成 员 
的 基因 结构 分 析 。LIV 代表 GATA 的 四 个 亚 家 族 


Fig.1 The gene structure and domain distribution of GATA members in castor bean 




















A. Phylogenetic analysis of GATA proteins in castor bean; B. Domain distribution of castor bean GATA members; 


C. Gene structure analysis of castor bean GATA genes. I-IV represent four subfamilies of GATA family 
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图 2 草 麻 与 拟 南 芥 GATA 蛋白 锌 指 结构 域 的 氨基 酸 序列 比 对 。 底 部 的 框 标示 锌 指 结 构 域 的 二 级 结构 


Fig.2 Amino acid sequence alignment of Arabidopsis and castor bean GATA zinc finger domains. The bottom part 


of the figure shows the secondary structure elements of zinc finger domains 


应 激 的 主要 器 官 ， 故 我 们 重点 挑选 了 8 个 在 叶片 
中 表达 较 高 的 基因 ( 表 1) ， 探 索 它 们 于 正常 生长 
条 件 下 和 黑暗 条 件 下 在 叶片 中 的 表达 情况 。 结 
如 图 5 所 示 ， 在 黑暗 人 处理 后 ， 亚 家 族 [LI 的 两 个 基 
( 29838. m001723 和 29596. m000720) 表现 出 明 
显 下 调 ， 亚 家 族 IE 的 一 个 基因 (29794. m003323) 
也 表现 出 一 定 的 下 调 趋势 ， 暗 示 着 这 三 个 基因 可 
能 参与 了 光 相 关 的 调节 。 





3 讨论 
KRAEMER PEE T 19 个 GATA 
家 族 成 员 ， 和 拟 南 芥 (29 个 ) 、 水 稻 (28 个) 相 
Lb, BUR] GATA 蛋白 基因 明显 偏 少 。 在 已 报道 
的 bZIP 转录 因子 家 族 (Jin 等 , 2013) 和 AP2/ERF 
转录 因子 家 族 (Xu 等 , 2013) FERM, SHE 
被 子 植物 相 比 ， 葛 麻 含 有 较 少 的 家 族 成 员 。 在 曹 
WRP, GATA 家 族 成 员 被 分 为 [-IV 四 个 亚 家 族 ， 
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图 3 草 麻 与 拟 南 芥 GATA 转录 因子 的 系统 进化 树 。I-IV 分 别 代 表 CATA 家 族 的 四 个 亚 家 族 


Fig.3 The phylogenetic tree of GATA transcription factors in castor bean and Arabidopsis. 





I-IV represents four subfamilies of GATA family, respectively 


和 同 为 双子 叶 植 物 的 拟 南 芥 一 致 (Reyes 55, 2004) , 
ALBERS AUS GATA 成 员 在 基因 和 蛋白 结构 上 
非常 相似 ， 同 源 性 也 很 高 ， 暗 示 着 曹 麻 和 拟 南 芥 
GATA 蛋白 具有 相似 的 功能 。 但 是 , 已 报道 的 单 
子叶 植物 水 稳 中 的 GATA 成 员 与 拟 南 芥 和 葛 麻 的 
GATA 成 员 在 基因 结构 和 和 蛋白 结构 上 具有 很 大 的 
差异 ， 水 稳 的 GATA 蛋白 被 分 为 六 个 亚 家 族 ( 亚 
家 族 I, II, HI, V, VI, VI), LEZIV, m 
LKI V 含有 ZnF PMZ 结构 域 和 FARI 结构 域 ， 
家 族 VI 含有 两 个 GATA 结构 域 ; 此 外 ， 亚 家 
族 V, VIA VIL 还 具有 异 于 拟 南 芥 和 曹 麻 的 基因 
结构 ， 如 亚 家 族 VIL 只 含有 一 个 外 显 子 (Reyes 等 ， 
2004) ， 这 些 差异 预示 着 GATA 家 族 在 单 、 双 子 
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叶 植 物 中 可 能 存在 结构 和 功能 的 分 化 ， 有 待 进 一 
步 研究 。 

本 研究 在 GATA 蛋白 中 鉴定 了 两 个 新 的 结构 
域 (TIFY 结构 域 和 ASXH 结构 域 ) TIFY 是 一 
个 植物 特异 的 蛋白 结构 域 ， 被 认为 与 蛋白 结合 
关 ， 广泛 存 在 于 JAZ (JASMONATE ZIM-domain ) 
蛋白 家 族 和 PEAPOD (PPD) 蛋白 中 ， 可 能 广泛 
参与 了 来 莉 酸 相关 的 信和 号 途径 (Ba 5, 2011; 
Vanholme 等 ，2007; Chini =, 2009; Melotto 等 ， 
2008) 。 目 前 关于 ASXH 结构 域 的 研究 主要 集中 
在 动物 中 ， 被 认为 与 多 梳 型 复合 蛋白 的 结合 有 关 ， 
含有 ASXH 结构 域 的 ASXL 1, ASXL 2 和 ASXL 3 
通过 与 多 梳 复合 蛋白 结合 而 广泛 参与 了 表 观 标记 
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( 泛 素 化 与 甲 基 化 ) 和 转录 水 平 的 调控 ， 进 而 参 
VATA HE AL HE Be, APEE BERK IA AAT 
前 列 腺 癌 等 疾病 的 形成 (Aravind 和 Iyer, 2012; 
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图 4 BER GATA 基因 在 不 同 组 织 中 的 表达 谱 热 图 
将 DGE 测序 的 数据 用 log2 标准 化 后 作 图 ， 有 颜色 的 标尺 
代表 的 是 log2 标准 化 后 的 表达 数据 


Fig.4 Heatmap represents the expression profiles of castor 

















bean GATA genes in different tissues 
This heatmap was generated based on the DGE expression data 
( normalized log2). The color scale (representing log2 


signal values) is shown at the top 
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图 5 半 定 量 RT-PCR 检测 草 麻 叶片 中 GATA 基因 在 黑 
处 理 下 的 表达 情况 (1, 2, 3 代表 实验 的 三 个 重复 ) 
Fig. 5 Semi-quantitative RT-PCR analysis of GATA genes 





expression level in castor leaf under dark treatment 


(1, 2, 3 represent three repeat experiments ) 


Gelsi-Boyer ^*, 2012; Katoh, 2013) , ASXH 结构 
域 在 植物 中 的 功能 需要 进一步 研究 。 

表达 分 析 发 现 ，C474 基因 的 表达 具有 明显 
的 组 织 偏爱 性 ， 有 8 个 成 员 在 叶 中 高 表达 ，3 个 
成 员 在 根 中 高 表达 ， 而 大 部 分 成 员 在 种 子 中 的 表 
达 很 低 ; 在 拟 南 草 中 ，GA7Th 基因 在 根 和 叶 中 表 
达 量 也 很 高 ( Manfield 等 , 2007) ， 这 些 结果 预示 
着 GATA 转录 因子 可 能 广泛 参与 了 根 和 叶 相 关 的 
生物 学 过 程 。 研 究 报道 ， 拟 南 芥 的 GATA 成 员 
GNC 和 CGA 1 广泛 参与 了 叶绿素 水 平 、 叶 绿 体 
大 小 、 光 合 效 率 和 碳 、 拓 代谢 的 调节 (Bi 等 ， 
2005; Hudson 等 , 2011; Chiang 等 , 2012) 。 这 两 
个 成 员 的 水 稻 同 源 基因 0s02g12790 和 杨 树 同 源 
基因 PdGNC 也 在 调节 叶绿素 水 平和 碳 、 氮 代谢 
中 发 挥 重 要 作用 (Hudson 等 , 2013; An 等 , 2014) 。 
EEP, FCT) YR SE 27940. m000323 在 根 和 
叶 中 表达 量 都 很 高 ， 预 示 着 27940. m000323 在 
调节 叶绿素 水 平和 碳 、 所 代谢 中 的 潜在 功能 。 为 
了 进一步 探索 在 叶片 中 高 表达 的 GATA 基因 与 光 
相关 调控 的 联系 ， 我 们 调查 了 这 些 基因 在 黑暗 条 
件 和 正常 生长 条 件 中 的 表达 情况 ， 找 到 了 三 个 在 
黑暗 处 理 时 表达 下 调 的 基因 ( 29794. m003323, 
29838. m001723 和 29596. m000720) ， 这 三 个 基 
Us] 的 拟 南 芥 同 源 基 因 在 黑暗 处 理 后 都 表现 出 明 
显 的 表达 下 调 ( Manfield 等 , 2007) 。 其 中 亚 家 族 
II 的 29794. m003323 是 拟 南 芥 GNC 和 CGA 1 3& 
因 的 同 源 基 因 ， 进 一 步 预示 着 27940. m000323 
在 调节 叶绿素 水 平和 光合 效率 中 的 潜在 功能 。 
29838. m001723 和 29596. m000720 属于 亚 家 族 
II， 目 前 关于 植物 中 亚 家 族 II 的 GATA 成 员 的 
功能 研究 较 少 ， 其 在 光 相 关 调控 中 的 功能 需 进 一 
步 探索 。 在 所 检测 的 三 个 曹 麻 亚 家 族 III 成 员 中 
有 两 个 在 黑暗 处 理 下 表达 下 调 ， 且 拟 南 芥 中 所 有 
的 亚 家 族 II 成 员 都 表现 出 黑暗 处 理 下 调 ， 暗 示 
着 亚 家 族 II 的 GATA 成 员 可 能 在 光 相 关 调 控 中 
发 挥 重要 作用 。 从 结构 上 看 ， 葛 麻 和 拟 南 芥 的 亚 
家 族 UWL 成 员 都 含有 CCT 结构 域 ， 且 大 部 分 还 含 
有 TIFY 结构 域 ， 这 两 个 结构 域 都 与 蛋白 之 间 的 
结合 有 关 (Chini 等 , 2009; Melotto 等 , 2008; Bai 
等 , 2011; Robson 等 , 2001; Griffiths 等 ，2003 ) , 
可 能 通过 结合 光 相 关 通 路 蛋白 而 参与 相关 过 程 的 
调节 。 
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葛 麻 是 一 种 非常 重要 的 非 食用 油料 作物 ， 攻 
麻油 是 非常 良好 的 生物 柴油 原料 ， 提 高 曹 麻 的 生 
产量 是 生物 柴油 产业 快速 发 展 的 必 经 之 路 ， 所 以 
提高 草 麻 产量 方面 的 研究 具有 重要 的 现实 意义 。 
本 研究 鉴定 了 与 草 麻 产量 息息相关 的 GATA. 家 
族 ， 并 对 其 系统 进化 、 理 化 性 质 、 基 因 结 构 、 结 
构 域 组 成 、 时 空 表达 和 黑暗 处 理 后 的 表达 情况 进 
行 了 详尽 分 析 ， 为 深入 研究 GATA 基因 家 族 的 生 
物 学 功能 ， 探 索 曹 麻 光 相关 调控 的 分 子 机 制 以 及 
提高 草 麻 产量 提供 了 非常 重要 的 理论 基础 和 指导 
意义 。 
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